رفع اعوجاج هندسی متون به‌کمک اطلاعات هندسی خطوط متن

Authors

Abstract:

Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips.  This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.  

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

رفع اعوجاج های فتومتریک و هندسی در تصاویر به کمک اطلاعات روشنایی پس زمینه و اطلاعات هندسی خطوط متن

تصاویر سند تهیه شده توسط اسکنر یا دوربین دیجیتال، همواره با دو نوع اعوجاج فتومتریک و اعوجاج هندسی همراه هستند. هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم افزارهای ocr می شوند. در این پایان نامه سعی بر این است که با ارائه ی روشی نوین و همچنین بهبود روش های گذشته، به رفع اعوجاج اسناد به منظور بهبود عملکرد نرم افزارهای ocr دست یابیم. در این پایان نامه به منظور تصحیح اعوجاج فتومتریک از روش درون نگ...

15 صفحه اول

رفع اعوجاج هندسی، پرسپکتیو و کجی تصاویر متن دوربینی فارسی

تصاویر متن دوربینی غالباً با اعوجاج هندسی، پرسپکتیو و کجی همراه هستند. این اعوجاج ها، عملکرد سیستم های نویسه خوانی نوری را با مشکل روبرو می سازند. برای رفع این اعوجاج ها روش های مختلفی ارائه شده است. اما اغلب این روش ها بر متون لاتین تمرکز دارند و قابل استفاده مستقیم برای متون فارسی نمی باشند. در این پایان نامه روشی نوین جهت رفع اعوجاج هندسی، پرسپکتیو وکجی تصاویر متن دوربینی فارسی ارائه شده است....

15 صفحه اول

استفاده از نمایش هندسی دادهها در تحلیل اطلاعات

نگرش آمارشناسان به تحلیل داده ها، طی سی سال گذشته، دستخوش یک انقلاب شده است. این انقلاب را به درستی مرهون نشر اثر تاریخی جان توکی تحت عنوان تحلیل اکتشافی داده هامیدانند. هسته اولیه این انقلاب در مجموعه مقالات نوشته شده به وسیله توکی ، همفکران و دانشجویان او شکل گرفت. این انقلاب با مقاله سال ۱۹۶۲ توکی تحت عنوان « آینده تحلیل دادها» به جهت گیری روشنی دست یافت. محتوای این مقاله، به نیاز مشخص بسیار...

full text

استفاده از نمایش هندسی داده ها در تحلیل اطلاعات

نگرش آمار شناسان به تحلیل داده ها، طی سی سال گذشته، دستخوش یک انقلاب شده است. این انقلاب را به درستی مرهون نشر اثر تاریخی جان توکی تحت عنوان تحلیل اکتشافی داده ها می دانند. هسته اولیه این انقلاب در مجموعه مقالات نوشته شده به وسیله توکی، همفکران و دانشجویان او شکل گرفت. این انقلاب با مقاله سال 1962 توکی تحت عنوان آینده تحلیل داده ها به جهت گیری روشنی دست یافت. محتوای این مقاله، به نیاز مشخص بسیا...

full text

ارائه روش توسعه مدل زوال هندسی خطوط ریلی: رگرسیون یا زنجیره مارکوف

امروزه مزایای استفاده از سیستم حمل و نقل ریلی مانند ایمنی، ظرفیت جابجایی بالا و کاهش آلودگی‌های زیست‌محیطی موجب گسترش روزافزون آن گردیده است. به منظور ایجاد اطمینان از عملکرد مناسب این سیستم، برنامه‌ریزی عملیات نگهداری و تعمیرات خطوط ریلی امری اجتناب‌ناپذیر است. یکی از ملزومات اصلی این نوع برنامه‌ریزی توسعه مدل زوال خطوط ریلی است که به کمک آن می‌توان فهمید چه زمانی وضعیت خطوط ریلی از حداقل قابل...

full text

ارزیابی هندسی فضایی مساجد معاصر تهران با استفاده از تحلیل مضمونی متون دینی

One of the most important problems in mosques designing is the quality of geometries and spaces which are appropriate for using in these religious buildings. It is obvious that one of the best references for studying this issue is Islamic teachings which are derived from verses and hadith. So, for responding to this question that what are the geometries and spaces which are appropriate for usin...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 14  issue 2

pages  141- 158

publication date 2017-09

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023